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Принципы построения электронного 
«Инверсионного грамматического словаря 
украинского языка» 


В данной статье рассматриваются основные принципы построения разработанного электронного 
«Инверсионного грамматического словаря украинского языка». Данный словарь предназначен для 
предоставления пользователю морфологической информации о слове, а также полной его парадигмы. 
В роли указателей основной морфологической характеристики каждого слова выступают буквенные 
символы — метки. Каждая метка определяет алгоритм словоизменения. 


Введение 


Создание украинского грамматического словаря и программ украинского 
автоматического словоизменения — актуальные вопросы современной компьютерной 
лингвистики. Кроме того, украинский грамматический словарь должен стать основой 
автоматического семантико-синтаксического анализатора текста. Компьютерный 
«Тнверсйний граматичний словник украйнсько! мови» предназначен для предостав- 
ления пользователю морфологической информации о слове, а также его словоизме- 
нительной характеристики, то есть его полной парадигмы. 

Целью работы является создание электронного «Инверсионного грамматичес- 
кого словаря украинского языка». Для достижения данной цели поставлены и 
решены следующие задачи: 

1. Выявление и формализация закономерностей украинского словоизменения. 

2. Синтез системы меток и алгоритмов словоизменения. 

3. Разметка словарной базы и тестирование алгоритмов. 


Принципы построения словаря 


Слова данного словаря объединены в группы по принципу принадлежности слов к 
определенной части речи и по общим конечным формально выраженным элементам. 
Каждое слово представлено в словаре начальной формой. Проставленные рядом метки 
содержат морфологическую информацию о данном слове. По сути, совокупность меток, 
принадлежащих каждой словарной единице, определяет алгоритм изменения слова. 

Метка представлена буквенными символами, цифровыми индексами, а также 
дополнительными символами при цифре. Буквенные символы указывают основную 
морфологическую характеристику имени (часть речи, род, одушевленность -— неоду- 
шевленность). 

В роли указателей основной морфологической характеристики имени буквен- 
ные символы (основные или дополнительные) имеют следующие значения: 

ч — склонение существительных мужского рода неодушевленных; 

чо — склонение существительных мужского рода одушевленных; 
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ж — склонение существительных женского рода неодушевленных; 
жо — склонение существительных женского рода одушевленных;, 

с — склонение существительных среднего рода неодушевленных; 

со — склонение существительных среднего рода одушевленных; 

пр — склонение прилагательных; 

з — склонение местоимений; 

ч — склонение числительных. 

В словаре каждому существительному соответствует метка, которая имеет сле- 


дующую структуру: 


одушевленность/неодущевленность тип склонения __ [дополнительная 
метка | ___ схема ударения. 

Например: 

аболщтонист чо[а Павлвна жо1!а 


Склонение существительных характеризуется определенными изменяемыми окон- 
чаниями, которые добавляются к неизменяемой основе. 

Цифра индекса (от 0 до 10) обозначает группу склонения. 

Цифра 0 означает, что слово неизменяемо (т.е. все формы внешне одинаковы). 

Цифры 1 - 10 означают разные группы склонения, зависящие от окончания и 
от того, на что оканчивается основа слова. Склонение слов разных групп различа- 
ются окончаниями. Окончания основных групп приведены в таблицах. «|» означает 
нулевое окончание. 

Звездочка при цифре индекса показывает, что при склонении в основе данного 
слова происходит чередование так называемой беглой гласной с нулем звука. 

Всякое слово, имеющее индекс со звездочкой, отличается от слова, имеющего 
соответствующий индекс без звездочки, только тем, что имеет в основе чередование 
беглой гласной с нулем; в остальных отношениях (окончания, ударение и т.д.) такие 
два слова одинаковы. 

Латинская буква от а до РГ (или две буквы, разделенные косой чертой), без 
штрихов или со штрихами -— обозначение схемы ударения. Общее значение букв: а — 
постоянное ударение на основе; Ъ — ударение на окончаниях (кроме случаев, когда 
окончание не содержит гласной); от с до Г- разные виды подвижного ударения. 

Каждому прилагательному в словаре соответствует метка, которая имеет следую- 
щую структуру: 

тип склонения _ степень сравнения __ схема ударения. 

Например: 

молод>ий пр1Ав/ навтац>йний пр1Са/ 

Прилагательные были распределены на пять групп в зависимости от окончаний 
и типа склонения. Метка А и В указывает на возможность образования сравнительной и 
превосходной степеней сравнения. Метка С - на отсутствие такой возможности. 
Способы формирования степеней сравнения для удобства представлены таблицами. 
Также следует обратить внимание на случаи чередования основы прилагательного 
при создании высшей простой степени сравнения. 

В словаре каждому местоимению соответствует метка, которая обозначает 
один из семи типов склонения. 

Например: 

будь-котрий 31 будь-чий 35 
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Тип 1 включает в себя местоимения на -ий; -хто (в множественном числе — 
основа < -к->), -що (во множественном числе основа — основа <-ч->); -той (парал- 
лельные формы женского рода только для местоимения на -той); наш, ваш и в 
косвенных падежах имеет окончания прилагательного первого типа. Тип 2 характе- 
ризуется окончаниями -Ш (кроме «хнй»), м, тв, свй. Тип 3 имеет окончание — 
ей и также характеризуется определенной системой окончаний. К типу 4 относится 
слово «Ахн», которое склоняется по образцу прилагательного типа 2. Тип 5 включает в 
себя слова на -чий и имеет общие окончания в косвенных падежах. Тип 6 включает в 
себя такие слова, как «я» (в косвенных падежах единственного числа — основа «мен», 
множественного — «н»); «ти» (в косвенных падежах: единственного числа — основа 
«мен», множественного — «в»); «себе» (нет формы именительного падежа; основа — 
«себ»; нет множественного числа). Тип 7 состоит из слова «в1н», форм женского и 
среднего рода данного местоимения и формы его множественного числа. 

В словаре каждому глаголу соответствует метка, которая имеет следующую 


структуру: 
вид глагола _ тип спряжения _ схема ударения [дополнительная метка] 
переходность приставка. 
Например: 
без>умствувати ндв 2а нп + буркнути дв За 


Вид глагола обозначается русскими буквами: дв (совершенный вид) или ндв 
(несовершенный вид), и ндв-дв в случае двувидового глагола; 

Тип спряжения обозначается цифрой от 1 до 18 и буквосочетанием САРи!!’. 
Каждый тип спряжения характеризуется определенным способом построения 3 основ- 
ных форм, от которых строятся все остальные формы парадигмы. Это: 1) инфинитив; 
2) 1 лицо единственного числа настоящего времени (для глаголов несовершенного 
вида) или будущего (для глаголов совершенного вида); 3) 3 лицо единственного чис- 
ла настоящего (будущего) времени. Далее будем условно называть - 1, Пили Ш фор- 
ма глагола. 

Схема ударения обозначается латинской буквой (или двумя буквами, разделен- 
ными косой чертой). Схема ударения складывается из 2 частей: 1) схема ударения 
личных форм настоящего (будущего) времени и повелительного наклонения (сокра- 
щенно — схема ударения наст. времени, ее символ пишется слева от косой черты); 
2) схема ударения личных форм прошедшего времени (ее символ пишется справа от 
косой черты). При этом метка а, выступающая как 2-й элемент записи, опускается, 
т.е. вместо а/а пишется а, вместо Б/а — Ь, вместо с/а — с. 

«Переходность» — переходность глагола, если глагол является непереходным, 
то ставится метка нп; отсутствие такой метки говорит о том, что глагол является 
переходным. 

«Приставка» — метка «+» означает наличие приставки в данном глаголе, она 
введена из-за сложности автоматического определения наличия приставки, что необ- 
ходимо при построении причастий. 

«Дополнительная метка» — дополнительные метки, обозначающие различные 
особенности при образовании парадигм (напр., чередование в приставке). Квадрат- 
ные скобки означают, что этих меток может и не быть. 

«*» — показывает, что при спряжении происходит чередование беглой гласной 
с нулем в конце приставки (в1д-/в1д1-, в-/вв1-, над-/над1-, роз-/роз1- и др.). 

«(@)» — означает, что слово имеет особенности (неправильности) при спряжении 
(брати — беру). 

«#» — для глаголов с ударной приставкой «ви-», которая влияет на схему ударе- 
ния, но повелительное наклонение образуется так же, как и в глаголах без этой при- 


66.2) 


ставки со схемой “Ъ” или “с”. 
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«^» — означает: для типа 6 отсутствие стандартного чередования согласных. 

Типы 4 и 5 соответствуют [ спряжению глагола, все остальные — П спряжению. 
Только в архаичном типе представлены оба спряжения, словоформы этого типа 
образуются особым образом. 

Особого внимания требует построение форм повелительного наклонения. Так, 
форма 2 лица единственного числа повелительного наклонения имеет ту же основу, 
что и в 3 лице настоящего времени (будущего) (т.е. в [ спряжении основа 1 лица и во 
П спряжении основа 3 лица единственного числа). Исключение: в типе 13 формы 
повелительного наклонения образуются от инфинитива (давати — давай). 

Окончания -и, -1мо(-1м), ть(-те) соответствуют тем глаголам, которые имеют 
схему ударения /Ъ или /с, когда основа заканчивается двумя согласными или стоит 
метка «#». В остальных случаях — чистая основа для 2 лица единственного числа и 
соответственно -мо и -те для других. Эти глаголы делятся на 3 группы: 1) оканчи- 
ваются на -й (читай, лай); 2) грамматическая основа заканчивается на д, т, 3, с, л, Н, В 
повелит., они смягчаются (кинуть — кинь, киньмо, киньте); 3) глаголы на согласные, 
которые не смягчаются. 


Заключение 


Созданный «[нверсйний граматичний словник укра1нсько! мови», который явля- 
ется, по сути, электронным аналогом печатного «Грамматического словаря русского 
языка» А.А. Зализняка, содержит около ста тысяч словарных статей. Планируется изда- 
ние печатного варианта «Гнверсйного граматичного словника укра!нсько1 мови». Книга 
будет содержать словник, каждое слово в котором снабжено меткой, определяющей 
алгоритм словоизменения, также в ней будет содержаться часть, в которой объясняется, 
как, используя метку, реализовать алгоритм словоизменения. 

Грамматический словарь и библиотеки автоматического словоизменения укра- 
инского языка могут стать основой для будущего семантико-синтаксического анализатора 
украиноязычных текстов. Данный словарь будет полезным как для неподготовленного 
говорящего, который изучает украинский литературный язык с целью общения, так 
и для специалистов, которые исследуют языковые явления и закономерности. 
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граматичного словника украйнсько! мови». Даний словник призначено для надання користувачу морфолойчно! 
1нформаци про слово, а також повно! його парадигми. В рол! вказвниюв основно! морфолойчно! характеристики 
кожного слова виступають лётерн! символи — мйки. Кожна м!тка визначае алгоритм словозм1ни. 
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